مقایسه ی جانهی الگوریتم em با دو روش جانهی میانگینی و نمونه های جدید در آمارگیری های پانلی

نویسندگان

آسیه رشیدی نژاد

asieh rashidinejad رضا نواب پور

reza navvabpour

چکیده

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معمولاً با کاهش پاسخگو در دوره های دوم به بعد تولید داده ها مواجه هستند. این امر که منجر به نمونه ی کاهیده می شود سبب کاهش کارایی براوردگرها و غالباً نیز سبب اریبی آن ها می شود. برای برخورد با این مشکل در آمارگیری پانلی روش های «جانهی» و «وزن دهی» گوناگونی وجود دارد که از جمله ی این روش ها، جانهی با الگوریتم em (expectation maximization algorithm) می باشد. در این مقاله پس از معرفی مفهوم های اولیه آمارگیری پانلی، انواع گم شدگی در آمارگیری های پانلی و ساختارهای گم شدگی، الگوریتم em به عنوان روشی برای جانهی داده های گم شده معرفی می شود. سپس با استفاده از داده های آمارگیری پانلی خانواری انگلیس (british household panel survey)، روش جانهی با الگوریتم em با دو روش جانهی دیگر از نظر معیارهای مختلف مقایسه می شود. نتایج این مطالعه نشان می دهد که جانهی متغیر تحت بررسی در آمارگیری پانلی خانواری انگلیس با استفاده از الگوریتم em وقتی که همبستگی بین دو دوره زیاد باشد، عملکرد بهتری دارد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه‌ی جانهی الگوریتم EM با دو روش جانهی میانگینی و نمونه‌های جدید در آمارگیری‌های پانلی

 در اقتصاد و سایر علوم اجتماعی، پژوهش‌گران اغلب تمایل به مدل‌بندی داده‌های پانلی که در آن واحدهای نمونه‌ای به‌‌طور مکرر در مقاطع زمانی مختلف مشاهده می‌شوند، دارند. یکی از کاربردهای داده‌های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری‌ها به ویژه آمارگیری‌های پانلی، بی‌پاسخی یک مشکل اساسی است که در داده‌های علوم اجتماعی و پزشکی به وفور رخ می‌دهد. این نوع مطالعه‌ها م...

متن کامل

جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها مع...

15 صفحه اول

مقایسه ی براورد میانگین جامعه بر اساس روش های جانهی نسبتی در آمارگیری های نمونه ای

وجود داده های گمشده در بیش تر آمارگیری ها امری اجتناب ناپذیر است. اما در تمامی طرح های آماری قبل از اجرای آن، مطمئناً راهکار مناسبی برای برخورد با این مشکل در نظر گرفته می شود. از جمله مواردی که برای برخورد با داده های گمشده در نظر گرفته می شود، جانهی و وزن دهی است که هر کدام مزیت ها و مشکلاتی دارند، اما استفاده از مجموعه داده ای که هیچ یک از این دو روش را در تحلیل به کار نگیرد، منجر به اریبی بر...

متن کامل

مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Mi...

متن کامل

مقایسه روش الگوریتم em و روش های متداول جانهی داده های گمشده: مطالعه روی پرسشنامه خوددرمانی بیماران دیابتی

مقدمه و اهداف: داده های گمشده، چالش بزرگی در پژوهش ها به شمار می آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش های گوناگونی برای کار با این داده ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده های پرسشنامه ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده ها ...

متن کامل

مقایسه‌ی دو روش جانهی لیتل-سو و نزدیک‌ترین همسایه در آمارگیری‌های پانلی به‌کمک شبیه‌سازی

چکیده. در بسیاری از نظام‌های آماری، نوعی از آمارگیری موسوم به « آمارگیری مکرر » و یا « نمونه‌گیری در طول زمان » متداول است که به شکلی مستمر در دوره‌های زمانی تکرار می‌شود. چنین آمارگیری‌هایی، اغلب به‌صورت یکی از روش‌های « مقطعی مکرر »، « چرخشی » و « پانلی » اجرا می‌شود. آمارگیری پانلی روشی است که در آن به نمونه‌ای ثابت در دوره‌های زمانی مختلف مراجعه می‌شود. در آمارگیری‌های پانلی علاوه بر بی‌پاس...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
بررسی های آمار رسمی ایران

جلد ۲۱، شماره ۱، صفحات ۸۹-۱۰۸

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023